8 - Mathematische Grundlagen zu Künstliche Intelligenz, Neuronale Netze und Data Analytics II [ID:30586]

50 von 647 angezeigt

Die Frage heißt, wie kann man also jetzt mit dem Deep,

bzw. genauer gesagt Deep, HCNNs umgehen?

Und so ist nicht die Lösung, die ich gerne machen wollte.

Stattdessen würde ich mir eben überlegen, wie kann ich ein HCNN so formulieren,

dass das tatsächlich Schritt für Schritt nach oben hin andere Aufgaben löst,

statt immer nur dieselbe Aufgabe.

Und dafür müssen wir die Folien ein bisschen komprimierter darstellen,

weil sonst geht es einfach nicht mehr auf das Bild drauf.

Und das Bild, was ich hier oben habe, wäre also sozusagen das Standardbild,

das ich schon x-mal gemalt habe.

Und hier unten hätten wir das Bild, wie wir das jetzt ein bisschen rumgedreht

zeichnen, was aber identisch ist.

Nur diese komprimierte Darstellung erlaubt mir halt noch mehr,

mehr von den HCNNs übereinander zu malen.

Und die, ja, also hier steht eigentlich keine neue Information drauf,

außer dass ich sage, ich kann das noch komprimierter zeichnen im Verhältnis zu hier oben.

So, jetzt erinnern wir uns da dran, dass wir gesagt haben,

im Feedforward-Fall war die dann gut, wenn ich nicht alle Aufgaben auf einmal

in einem Hidden Layer lösen will, sondern wenn ich die so nacheinander löse.

Da gab es ja noch mehr Möglichkeiten.

Entweder ich sage, die untere Schicht hier löst die Aufgabe

und macht ein Offset für die nächste Schicht.

Und dann rechnet die Aufgabe hier den Residuel Error von dem,

was der Untere nicht gekonnt hat, und so weiter und so fort.

Aber die sehen sich untereinander nicht.

Und diesen Ansatz habe ich dann versucht jetzt zu übertragen auf die HCNN-Darstellung,

weil auch ein HCNN hat ja die Eigenschaft, dass es sozusagen

in einem bestimmten Vektor jetzt Fehler darstellt.

Also sind wir in der Lage, das so zu übertragen.

Das erste Proposal, was ich dazu hatte, ist völlig schiefgelaufen.

Deswegen zeige ich das erst gar nicht.

Gucken wir uns gleich das zweite an.

Hier habe ich unten ein HCNN.

Und das sieht völlig normal aus.

Das weiß auch nichts von irgendwelchen anderen Rechnungen.

Das weiß nur, dass es jetzt hier die Aufgabe zu lösen hat.

So, und jetzt ist ja, wie wir wissen, hier im oberen Teil von einem State Vector

steckt ja der Expected Value drin.

Den will ich gerne nach oben weiter transportieren,

so wie ich das bei dem Feedforward-Netz hier auch dargestellt habe.

Also ich will sozusagen das hier wiederholen.

Will ich weitergeben?

Und das soll dann hier unten eingefüttert werden.

Ja, wie mache ich das?

Das Ding hier ist riesengroß.

Die Observablen, die ich zwischendurch habe, sind aber klein.

Und dann muss es aber wieder riesengroß werden, weil es muss ja am Ende hier drauf passen.

Also das mache ich dann einfach so, indem ich sage,

diese gestrichelte Linie hier repräsentiert zwei Matratzen eigentlich.

Die erste Matrix macht aus dem riesengroßen was Kleines,

Teil einer Videoserie :

Mathematische Grundlagen zu Künstliche Intelligenz, Neuronale Netze und Data Analytics II

Presenters

Dr. Hans Georg Zimmermann

Zugänglich über

Offener Zugang

Dauer

00:50:35 Min

Aufnahmedatum

2021-04-07

Hochgeladen am

2021-04-07 16:58:05

Sprache

de-DE

Einbetten

Wordpress FAU Plugin

 https://www.fau.tv/clip/id/30586

iFrame

<iframe src="https://api.video.uni-erlangen.de/services/oembed/?url=https://www.fau.tv/clip/id/30586&format=iframe&maxwidth=1280&maxheight=720" width="1280" height="720"seamless allowfullscreen style="border: 0; padding: 0; margin: 0;overflow: hidden;"></iframe>

Herunterladen

Video

Per RSS abonnieren